Сейчас мне лень глубоко думать на эту тему, но быстрый и наверняка неправильный хак моего симулятора в сторону снижения расходов на инферсию показал, что схема 4-хбитного сумматора в асинхронном режиме выполняется за вдвое меньшее количество шагов по вентилям.
(
Временные диаграммы )